Escola de Métodos em Ciência Política
Nota
Tem dividido com o Python o posto de software mais popular entre cientistas sociais
Ambiente de desenvolvimento para cálculos estatísticos e gráficos
Vários cálculos estatísticos mais sofisticados estão disponíveis no R através de pacotes desenvolvidos pela comunidade
Escrita:
– Elementos (ex: numeric, character, factor…);
– Funções básicas (ex: sum(), table(), sd());
– Composição do script (ex: c(), for loop);
Leitura:
– Identificação de funções;
– Diferentes soluções;
– Alertas de erros;
Importante
adquirir autonomia com o software
Dada a multiplicidade de soluções, de alertas de erros e o universo de pacotes com diversas funções
a habilidade mais importante é saber pesquisar no Google
Melhor em inglês pela quantidade de fóruns:
– Melhor fórum: Stackoverflow
– Posit Community despontando
Dica
IA como nova ‘habilidade’: além do ChatGPT
Aparência
Linhas escritas no ambiente onde se registra o script (Scripts são arquivos de texto)
Ctrl + enter (cmd + enter no mac)
Hastags
Fluxos: scripts e projetos
Além das funções de exponencial e raiz quadrada
Respectivamente, ^ e sqrt()
Cuidado com a utilização de etiquetas com o mesmo nome de funções, pode gerar confusão no script
Em basicamente tudo que iremos fazer no R, a classe da informação importa Em termos elementares, ou ao nível dos valores, existem três grandes classes:
- Numeric (númerico);
- Logical (lógico);
- Character ou factor (caracteres);
Para obter a informação sobre a classe, iremos aprender nossa primeira função no R: class()
numeric é a classe composta por valores númericoslogical é a classe composta por TRUE, FALSE e NANão é preciso escrever sempre TRUE e FALSE, podemos resumir para T e F, respectivamente
Por trás dos valores T e F, há valores númericos correspondente a 1 e 0
character é a classe composta por nomes
Importante característica é que os nomes devem estar dentro de aspas, caso contrário, o R não reconhecerá como caracter
[1] TRUE
[1] FALSE
[1] FALSE
Um data.frame é o mesmo que uma tabela do SQL ou uma planilha Excel
seus dados provavelmente serão importados para um objeto data.frame
data.frame’s são listas especiais em que todos os elementos possuem o mesmo comprimento.
Cada elemento dessa lista pode ser pensado como uma coluna da tabela - ou como uma variável. Uso do ‘$’
Seu comprimento representa o número de linhas - ou seja, de observações
Funções úteis:
head() # Mostra as primeiras 6 linhas.
tail() # Mostra as últimas 6 linhas.
dim() # Número de linhas e de colunas.
names() # Os nomes das colunas (variáveis).
str() # Estrutura do data.frame. Mostra, entre outras coisas, as >classes de cada coluna.
cbind() # Acopla duas tabelas lado a lado.
rbind() # Empilha duas tabelas.CURSO DE R